﻿ Curs 8 Jocuri Regulile de joc • Doi jucători: MAX şi MIN • Fiecare are ca obiectiv câştigarea jocului • Doar unul poate câştiga sau se poate obține remiză • În modelarea iniţială nu intervine şansa – dar ea poate fi simulată • Exemple: – şah – checkers – tic-tac-toe – Jocul tic-tac-toe MAX joacă cu X-uri MIN joacă cu O-uri Jocul tic-tac-toe MAX Jocul tic-tac-toe MIN Jocul tic-tac-toe MAX Jocul tic-tac-toe MIN Jocul tic-tac-toe MAX Jocul tic-tac-toe MIN Jocul tic-tac-toe MAX Jocul tic-tac-toe MIN Jocul tic-tac-toe MAX Remiză! Jocul tic-tac-toe Jocul tic-tac-toe MAX Jocul tic-tac-toe MIN Jocul tic-tac-toe MAX Jocul tic-tac-toe MIN Jocul tic-tac-toe MAX Jocul tic-tac-toe MIN Jocul tic-tac-toe MAX Jocul tic-tac-toe MAX câştigă Reprezentarea ca o problemă de IA 1 Problemă versus instanţă 2 Spaţiul stărilor: – o stare: poziţia pe tabla a semnelor între două mutări – dimensiunea spaţiului: 39 3 Reprezentarea unei stări: – o matrice 3x3 4 Reprezentarea unei tranziţii – algoritmic (în abordarea de faţă) 5 Cum controlăm evoluţia jocului? – metoda MIN-MAX – metoda ALPHA-BETA Arborele de joc MAX o clasă de simetrie Arborele de joc MAX MIN Arborele de joc MAX MIN Arborele de joc MAX MIN Arborele de joc MAX MIN Valoarea unei stări Câştig pentru MAX: +∞ Valoarea unei stări Câştig pentru MIN: -∞ Evaluarea unei stări O stare este mai bună dacă deschide mai multe posibilităţi de câştig până la sfârşitul jocului Un exemplu de funcţie de evaluare: valoarea stării este diferenţa dintre numărul de linii pe care le mai poate completa MAX şi cele pe care le mai poate completa MIN 12345678 Evaluarea unei stări O stare este mai bună dacă deschide mai multe posibilităţi de câştig până la sfârşitul jocului Un exemplu de funcţie de evaluare: valoarea stării este diferenţa dintre numărul de linii pe care le mai poate completa MAX şi cele pe care le mai poate completa MIN 8 - 12345 =3 Evaluarea unei stări O stare este mai bună dacă deschide mai multe posibilităţi de câştig până la sfârşitul jocului Un exemplu de funcţie de evaluare: valoarea stării este diferenţa dintre numărul de linii pe care le mai poate completa MAX şi cele pe care le mai poate completa MIN Liniile fără nici un semn pot fi luate de ambii jucători Evaluarea unei stări O stare este mai bună dacă deschide mai multe posibilităţi de câştig până la sfârşitul jocului Un exemplu de funcţie de evaluare: valoarea stării este diferenţa dintre numărul de linii pe care le mai poate completa MAX şi cele pe care le mai poate completa MIN Liniile fără nici un semn pot fi luate de ambii jucători Evaluarea unei stări O stare este mai bună dacă deschide mai multe posibilităţi de câştig până la sfârşitul jocului Un exemplu de funcţie de evaluare: valoarea stării este diferenţa dintre numărul de linii pe care le mai poate completa MAX şi cele pe care le mai poate completa MIN Liniile fără nici un semn pot fi luate de ambii jucători Evaluarea unei stări O stare este mai bună dacă deschide mai multe posibilităţi de câştig până la sfârşitul jocului Un exemplu de funcţie de evaluare: valoarea stării este diferenţa dintre numărul de linii pe care le mai poate completa MAX şi cele pe care le mai poate completa MIN Liniile fără nici un semn pot fi luate de ambii jucători Evaluarea unei stări O stare este mai bună dacă deschide mai multe posibilităţi de câştig până la sfârşitul jocului Un exemplu de funcţie de evaluare: valoarea stării este diferenţa dintre numărul de linii pe care le mai poate completa MAX şi cele pe care le mai poate completa MIN Liniile fără nici un semn pot fi luate de ambii jucători Evaluarea unei stări O stare este mai bună dacă deschide mai multe posibilităţi de câştig până la sfârşitul jocului Un exemplu de funcţie de evaluare: valoarea stării este diferenţa dintre numărul de linii pe care le mai poate completa MAX şi cele pe care le mai poate completa MIN Liniile fără nici un semn pot fi luate de ambii jucători Evaluarea unei stări O stare este mai bună dacă deschide mai multe posibilităţi de câştig până la sfârşitul jocului Un exemplu de funcţie de evaluare: valoarea stării este diferenţa dintre numărul de linii pe care le mai poate completa MAX şi cele pe care le mai poate completa MIN Liniile fără nici un semn pot fi luate de ambii jucători Evaluarea unei stări O stare este mai bună dacă deschide mai multe posibilităţi de câştig până la sfârşitul jocului Un exemplu de funcţie de evaluare: valoarea stării este diferenţa dintre numărul de linii pe care le mai poate completa MAX şi cele pe care le mai poate completa MIN Liniile fără nici un semn pot fi luate de ambii jucători Evaluarea unei stări O stare este mai bună dacă deschide mai multe posibilităţi de câştig până la sfârşitul jocului Un exemplu de funcţie de evaluare: valoarea stării este diferenţa dintre numărul de linii pe care le mai poate completa MAX şi cele pe care le mai poate completa MIN Liniile fără nici un semn pot fi luate de ambii jucători Evaluarea unei stări O stare este mai bună dacă deschide mai multe posibilităţi de câştig până la sfârşitul jocului Un exemplu de funcţie de evaluare: valoarea stării este diferenţa dintre numărul de linii pe care le mai poate completa MAX şi cele pe care le mai poate completa MIN Liniile fără nici un semn pot fi luate de ambii jucători Evaluarea unei stări O stare este mai bună dacă deschide mai multe posibilităţi de câştig până la sfârşitul jocului Un exemplu de funcţie de evaluare: valoarea stării este diferenţa dintre numărul de linii pe care le mai poate completa MAX şi cele pe care le mai poate completa MIN Liniile fără nici un semn pot fi luate de ambii jucători 3 - 0 =3 Evaluarea unei stări 2 - 1233 =-1 Evaluarea: de jos în sus MAX 1MIN 0 -1 0 1 Evaluarea: de jos în sus MAX 1MIN 0 -1-1-1 0 1 Evaluarea: de jos în sus -1MAX 1MIN 0 -1 0 1 -1 0 -2 0 -1 Evaluarea: de jos în sus -1MAX 1MIN 0 -1 0 1 -1 0 -2-2 -1 0 Evaluarea: de jos în sus -1-2 MAX 1MIN 0 1 2 -1 0 1 -1 0 -2-2 -1 0 Evaluarea: de jos în sus -1-2 MAX 1MIN 0 11 2 -1 0 1 -1 0 -2-2 -1 0 Evaluarea: de jos în sus 1 -1-2 1 MAX 1MIN 0 11 2 -1 0 1 -1 0 -2-2 -1 0 Evaluarea: de jos în sus O dezvoltare a spaţiului de joc pe o adâncime de 2 duce la MAX alege mutarea cea mai 1 concluzia că jucătorul care joacă bună pentru el primul are o şansă de câştig în plus dacă ocupă centrul -1-2 1 MAX 1 MIN 0 11 2 -1 1 0 -1 MAX gândeşte: MIN 0 alege mutarea cea mai -2-2 -1 0 bună pentru el = cea mai proastă pentru mine Metoda MIN-MAX function min-max(state, player, depth) begin if (depth = 0) then return score(state); val = worst(player); while (mai sunt stări de generat) begin generez o stare -> s; val s; end Evaluarea: de jos în sus s -1MAX 1 0-1 1 0 MIN min-max( ,MIN,1) val=-1; player = MAX; depth=2; while (mai sunt stări de generat) begin generez o stare -> s; val s; val s; newval <- alpha-beta(s, not(player), depth-1); if player=MAX & newval ≤ val then return(newval); else if player=MIN & newval ≥ val then return(newval); else val back-up-compare(val, min-max(s, not(player), depth-1), player); // următoarea mişcare micşorează spaţiul de căutare în cazul în care se obţine poziţia de câştig // într-una din stările generate: if (val = -worst(player)) return(val); end return(val); end function worst(player) Apelul: begin if player = MAX then return -∞; else return +∞; alpha-beta ( ,MAX,2) end function back-up-compare(val1, val2, player) begin if player = MAX then return max(val1, val2); else return min(val1, val2); end 